#設計 AI
AI程式設計時代來了!馬斯克預言:年底不用再寫程式碼
馬斯克表示,AI將直接編寫二進制程式碼,且AI生成的二進制程式碼將比任何編譯器生成的都要高效。“到今年年底,我們甚至不再需要程式設計。”日前,馬斯克在一段發佈的視訊中如是說,AI將直接編寫二進制程式碼,且AI生成的二進制程式碼將比任何編譯器生成的都要高效。他預測,隨著AI技術的持續發展,人類對程式語言的依賴將會逐漸減弱。AI 系統可能自行完成從需求到可執行程序的整個工作流程,因此,程式設計將作為過時的中間步驟被時代拋棄,這將顯著縮短“從提出創意到執行落地”的距離。未來,程式設計這種職業或將不復存在。雖說馬斯克這番話引發了業內不少爭議,畢竟更多人更傾向於將AI看作“輔助”而不是“取代者”,但這番言論無疑為本就火熱的AI程式設計賽道又添了一把火。無獨有偶,近幾日國產AI的“春節檔”上新潮中,不少都瞄準了AI程式設計。例如字節2月14日更新的豆包2.0系列中,便包含Code模型,專為程式設計場景打造,強化程式碼庫解讀能力、提升應用生成能力、增強模型在Agent工作流中的糾錯能力;MiniMax 2月12日上線最新旗艦程式設計模型MiniMax M2.5,是全球首個為Agent場景原生設計的生產級模型,支援PC、App、跨端應用的全端程式設計開發;智譜在2月11日推出新一代旗艦模型GLM-5,內部評估顯示,其在前端、後端等程式設計開發場景中平均性能較上一代提升超20%;至於有望在春節期間亮相的DeepSeek V4,據媒體消息和機構報告顯示,程式設計能力或是其“王牌”。值得注意的是,Anthropic也在《2026年智能體編碼趨勢報告》中指出,傳統軟體開發的遊戲規則正在被徹底改寫。一個曾預計需要4到8個月的項目,使用Claude大模型後僅用兩周就完成。《報告》明確指出,程式設計師這一職業並不會消失,但那些“只會寫程式碼”的程式設計師將逐漸被市場淘汰。Anthropoic的Claude可以說是海外AI程式設計的龍頭。而在AI 賦能軟體開發各環節帶來效率提升較為明顯的情況下,以Claude 為代表的大模型和以Cursor為代表的IDE 工具營收快速增長,已體現出較好的商業化效果。廣發證券指出,與海外AI 輔助程式設計工具相比,國產AI 程式碼輔助工具產品具有兩個特點:一是呼叫國產AI 大模型的比例較高;二是儘管國產AI輔助程式設計工具在功能性上與Cursor 等海外產品有一定差距,但其使用價格相對更低、性價比更高。Grand View Horizon資料顯示,2024年全球AI 程式碼工具市場價值61億美元,預計到2030 年將達到260億美元,2024-2030年復合年增長率為27.1%。由於AI 程式設計直接作用於核心的開發環節,券商認為其有望成為最具價值的AI 應用之一。國聯民生證券認為,國內頭部開源大模型持續發力AI 程式設計,國內IDE 以及各類低程式碼平台有望明顯受益,依託頭部開源模型,IDE 及低程式碼平台的產品力有望持續提升,並加速在各個垂直細分領域的滲透以及企業級應用的落地,建議重點關注卓易資訊、普元資訊、金現代等公司。 (科創板日報)
當 AI,開始設計 AI
這不是科幻片,而是 2026 年 2 月剛剛發生的現實。如果有人在 2020 年告訴你,「六年後,AI 會自己設計下一代 AI」,你大概會覺得這是天方夜譚。但就在上周,OpenAI 的 GPT-5.3-Codex 和 Anthropic 的 Claude Opus 4.6 同日發佈,兩家公司不約而同地宣佈了一個令人震驚的消息:這些 AI 模型,已經能夠有意義地參與改進自己。這只是 2026 年初,中國農曆馬年春節之前的「AI 春運」大戰的開始,但很有可能多年後重新回頭看,這可能是一個 AI 進化史上的重要節點——人工智慧,已經開始非常熟練地,設計和並建造下一代人工智慧了。更重要的是,這對使用者——人類——來說,到底意味著什麼?作者 Matt Shumer 在文章中為大家拆解了,為什麼現在,可能正是這樣一個節點時刻。01自我進化的「潘多拉魔盒」已開啟OpenAI CEO Sam Altman 在 Twitter 上興奮地表示:「我喜歡用這個模型建構;感覺比基準測試所示的進展更大。能以 5.3-Codex 來開發 5.3-Codex 的速度,這是未來的一個訊號。」這句話背後的含義讓人細思極恐。Anthropic CEO Dario Amodei 更是直接承認:「我們基本上已經讓 Claude 設計下一版本的 Claude 本身,不是完全地,也不是在所有方式上,但在很多方面,這個循環開始快速閉合。」或許,我們正在見證 AI 發展史上最重要的一個拐點:從人類設計 AI,到 AI 協助設計 AI,再到 AI 主導設計 AI。這個過程比任何人預想的都要快。但現實遠比宣傳複雜。Medium 分析師 Alex Carter 在 48 小時實測後潑了一盆冷水:Codex 5.3「感覺倉促。行銷承諾與現實不符。它聲稱『幫助自己建設』聽起來令人印象深刻,直到你意識到它無法可靠地建構登錄系統。」這種巨大的期望差距恰恰暴露了當前 AI 自我改進的真實狀態:概念已經突破,但實際能力仍在爬坡。02知識工作體系的重構更值得關注的是這背後的連鎖反應。如果 AI 真的能自我迭代最佳化,那麼依賴知識積累和經驗傳承的工作,將面臨根本性衝擊。這不是簡單的「AI 取代人類」,而是整個知識工作體系的重構。技術分析師 Sebastian Raschka 在《State of LLMs 2025》中指出,2026 年的進展「主要來自推理而非純粹的訓練方面」,進步出現在「架構調整、資料質量改進、推理訓練、推理擴展和工具呼叫」等多個維度。這意味,AI 不再是單純的工具,而是開始具備「思考如何更好地思考」的元認知能力。我們可以想像這樣的場景:一個法律 AI 不僅能處理案例,還能分析自己在處理過程中的不足,並設計改進方案;一個醫療診斷 AI 不僅能看病,還能反思自己的診斷邏輯,最佳化決策路徑。當 AI 開始擁有自我反思和改進的能力,人類在知識工作中的獨特優勢——經驗積累、模式識別、創新思維——還能保持多久?03掌控權還在人類手中... 嗎?但最讓人擔憂的不是就業問題,而是控制權問題。AI 安全研究者 Jared Kaplan 一針見血地指出:「當 AI 開始獨立設計下一代 AI 時,它使用的最佳化路徑可能完全超出人類認知範圍... 我們無法檢查是否有『特洛伊木馬』或錯位的目標函數隱藏其中。」這就是 AI 自我改進的核心悖論:我們需要足夠智能的 AI 來解決複雜問題,但當 AI 智能到可以改進自己時,我們可能就失去了理解和控制它的能力。HackerNews 和 Reddit 社區的討論也反映了這種擔憂。使用者們質疑基準測試結果,認為 GPT-5.3 和 Claude Opus 4.6 的性能資料,可能存在「不同的基準測試或資料解釋」問題。更重要的是,當 AI 能夠自我改進時,傳統的評估和監管體系都可能失效。Interconnects AI 分析師 Nathan Lambert 的觀察很有啟發性:「我們正在走向一個 AI 世界,其中與模型發佈相關的基準,不再對使用者傳達有意義的訊號。」換句話說,我們甚至可能無法精準衡量,這些自我改進的 AI 到底有多強。Fello AI 的分析報告顯示,2024 年近 90% 的著名 AI 模型來自工業界,OpenAI 不再主要與研究實驗室競爭,而是「與超大規模計算公司、晶片製造商和資金充足的 AI 優先公司競爭」。在這場競賽中,自我改進能力已經成為必爭之地。誰先實現真正的 AI 自我迭代,誰就能在未來五年的知識工作革命中佔據主導地位。就像 Matt Shumer 在文章開頭提到的 2020 年 2 月——如果你當時足夠敏銳,你會注意到「有幾個人在談論海外傳播的病毒(新冠)」。現在,我們也處在這樣一個歷史轉折點:AI 自我改進的種子已經種下,接下來的五年,整個知識工作的生態都將被重新定義。問題不再是「會不會發生」,而是「我們準備好了嗎」。 (極客公園)
GitHub 上,人類已經幹不過 AI 了
今年,GitHub 上,AI 提交量佔比將達到 20%如果幾年前有人跟碼農同學說,「你以後可能要和 AI 搶 GitHub 提交記錄了」,他大概會笑掉大牙。但現在,他可能完全笑不出來了。根據 SemiAnalysis 最新發佈的分析報告,Anthropic 的 Claude Code,目前已經貢獻了 GitHub 上 4% 的公開提交量,並且有望在 2026 年底:達到 20% 的日提交量。這不是一個簡單的數位遊戲。當一個 AI 工具開始在全球最大的程式碼託管平台上「刷存在感」,它實際上正在重新定義什麼叫「寫程式碼」。01. AI「霸榜」GitHub4% 看起來並不是個很大的數字,但可怕的是這個數字背後的意義。GitHub 每天的提交量是一個天文數字。全球數千萬程式設計師在這個平台上推送程式碼、修復 bug、發佈新功能。而現在,每 25 次提交中,就有 1 次來自 AI。Anthropic Claude Code 負責人 Boris Cherny 在 X 上毫不避諱地「炫耀」:他的團隊現在 100% 使用 Claude Code 寫程式碼,連小的編輯都不再手動操作。更誇張的是,他們用一周半時間就用 Claude Code 建構了 Cowork 應用。這種效率提升不是線性的,而是指數級的。但真正讓人震撼的不是速度,而是質量。一位企業使用者透露,他 80% 的時間在使用 Claude Code,剩下 20% 用其他工具。「我的公司為 Claude Code 付費,我甚至不看成本。」這句話很有意思——當一個工具好用到讓人「不看成本」,說明它創造的價值,已經遠超價格。曾有業內人士曾這樣評價 AI Coding 的優勢:「AI 能繞過官僚主義。如果猶豫不決會讓大型組織陷入癱瘓,AI 不在乎。它會愉快地生成一個版本 1。」這句話點出了 AI 程式設計的核心優勢——沒有包袱,沒有猶豫,沒有「完美主義焦慮」。02. 程式設計師的「存在危機」但硬幣總有兩面。在 Hacker News 上,一位使用者分享了他的挫敗感:「多次我希望程式碼看起來是某種樣子,但它不斷拉回到它想要做事情的方式... 最終,我發現不與它爭鬥、讓它按照它想要的方式做事情更容易。」這段話透露出一個微妙的權力轉移:從「人指導 AI」到「人適應 AI」。Every 公司 CEO Dan Shipper 在部落格中寫道:「我們正處於自主程式設計的新時代。你可以在不看一行程式碼的情況下建構令人驚嘆的複雜應用程式。」聽起來很美好,但這也意味著傳統意義上的「程式設計師」,正在消失。如果你不需要看程式碼就能建構應用,那「會寫程式碼」,還算是一種核心技能嗎?SemiAnalysis 的分析師預測,這個趨勢將推動 Anthropic 在 2026 年實現爆發性增長,甚至超越 OpenAI。相比之下,GitHub Copilot 和 Office Copilot 雖然領先了一年,但「幾乎沒有作為產品取得任何進展」。這個對比很殘酷,也很說明問題:在 AI 時代,先發優勢可能不如產品體驗重要。03. 重新定義「程式設計師」但程式設計師同學可能不需要過分焦慮,程式設計師這個崗位不會消失,只是這個職業的定義在改變。就像 Dan Shipper 說的,即使在 2025 年,「你仍然需要真正理解底層架構,也許你仍然需要去查看程式碼」。但這個「需要」的含義已經不同了。程式設計師正在從「程式碼編寫者」變成「AI 協調者」。你需要知道如何與 AI 對話,如何審查它的輸出,如何在它犯錯時糾正它。你需要理解系統架構,但不一定需要親自實現每一行程式碼。一位 Google 工程師的反思很有代表性:社區對 AI 程式設計能力的討論「緊張」,一方面驚嘆於能力的提升,另一方面擔心被替代。但他強調,領域專業知識仍然重要,原型和生產環境之間的差距仍然存在。當 AI 程式設計足夠便宜、足夠好用,整個軟體開發的經濟學都會改變。也許 20% 的 GitHub 提交量只是開始。也許幾年後,我們會看到 50%、80%,甚至更高的比例來自 AI。這未必意味末日,而是一個新開始。真正的程式設計師不會被 AI 替代,而會學會如何讓 AI 成為最強大的工具。就像計算器沒有讓數學家失業一樣,AI 也不會讓程式設計師失業——它只會讓那些拒絕進化的人失業。程式碼即是機器語言,是 AI 的母語,將機器語言交還給機器本身,人類用自然語言描述 Idea,看起來似乎是個更自然的結果。 (極客公園)
再見,程式設計師!馬斯克預言2026年AI改變世界,進入奇點之年!
不用多說,相信每個人的時間線全被Claude Code刷屏了。馬斯克甚至斷言,「我們已進入奇點!2026年就是奇點之年」。這幾天,Claude Code在全網掀起的陣仗可真不小。一睜眼,地球首富馬斯克重磅宣告:我們已進入奇點!起因竟是,Midjourney創始人公開稱,聖誕假期自己敲的程式碼,比過去十年加起來還要多,簡直太瘋狂。「雖然能感到侷限,但我知道一切都不再一樣了」。同一天,馬斯克不止一次,直接宣稱「2026年就是奇點之年」。這個點評同樣是對Claude Code的高度讚揚。如今,包括Anthropic之父、前DeepMind/OpenAI研究員、Google首席工程師等大佬在內,都為其感到震驚。馬斯克:2026,奇點降臨一直以來,奇點這一概念就像科幻詞一般的存在。雷·庫茲維爾曾在2005年《奇點臨近》一書中,預測道技術奇點大約發生在2045年。而在最新出版的《奇點更近》著作中,他再次重申奇點時間:仍是2045年。誰曾想,這個看似還很遙遠的時刻,一下子被拉到了現在——2026年。所謂的技術奇點,是指技術在長期內增長緩慢,但在某個臨界點急劇加速,呈指數式上升。能夠讓馬斯克有這麼深感觸,竟是Claude Code席捲全網的強大程式設計能力。一點也不誇張地說,2026年開年這局,身邊的人都瞬間成為了Claude Code使用者。生物醫學工程師Derya Unutmaz雖不是專業程式設計師,升級訂閱就是為了更頻繁使用Claude Code。就連xAI聯創Igor Babuschkin感慨道,「有些年頭風平浪靜,啥大事沒有,可有些星期卻濃縮了數十年的變遷」。一夜之間,Claude Code為何變得這麼強了?真正的「民間高手」:Claude Opus精準來說,不是它變強了,而是一直就很強。去年11月底,超大杯Claude Opus 4.5一出世,Anthropic便宣稱其是全球最頂尖的編碼模型。內部測試中,Opus 4.5+Claude Code聯動使用,平均效率暴增220%。當時,Anthropic工程師預言,也許就在2026年上半年,軟體工程就被終結了。如今看來,可能就在最近了。剛剛,在最新升級的LiveBench榜單上,Claude Opus 4.5登頂,直接碾壓GPT-5.1 Codex MAX、Gemini 3 Pro。創始人Bindu Reddy稱,在聖誕假期期間,團隊改進了LiveBench,為了防止AI刷分作弊。這個排名在很大程度上,反映了這些LLMs在現實世界中的表現。去年12月,METR的一份報告揭秘了,全球最能打的AI還是Claude Opus 4.5。它在自主編碼任務中,能夠連續5小時不崩,也是迄今為止公開的AI完成長程任務時間最長的模型。AI大佬Simon Willison表示,Opus 4.5和GPT-5.2就像是一個轉折點。「模型逐步跨越到了一個隱形能力界限的時刻,忽然間,大量的編碼難題都被解決了」。即便是程式設計0經驗的人,也能在不到十分鐘的時間,打造出一款功能齊全的網頁應用。就像網友所言,如果不出意外的話,Claude Code可能會讓更多人成為百萬富翁。人類的最後一次發明如果我們翻開哲學家戴維·查爾默斯(David J. Chalmers)那篇經典的《奇點:哲學分析》,會發現當下的瘋狂景象,不過是這套嚴密邏輯推演的必然兌現。論文地址:https://consc.net/papers/singularity.pdf在查爾默斯的推導模型中,我們正處於一個被稱為「擴展前提(Extension Premise)」的關鍵節點。他將這一過程量化為從AI到AI+再到AI++的階躍:AI:人類水平的人工智慧。AI+:超越人類最強大腦的智能。AI++:超級智能,其超越程度正如人類超越老鼠一般。正如查爾默斯引用的I.J. Good在1965年的那個著名論斷:「超智慧型手機器(Ultraintelligent Machine)將是人類需要製造的最後發明」。邏輯非常性感且冷酷:機器設計機器:既然設計機器本身是一種智力活動,那麼一台超越人類的機器(AI+),必然能設計出比人類所能設計的更好的機器。遞迴的雪崩:這台被AI+設計出的新機器,擁有更強的設計能力,它將設計出下一代更強的機器。無限逼近:只要這台機器能通過編寫程式碼來最佳化自身,我們將無可避免地迎來一場「智能爆炸」。我們現在看到的,正是查爾默斯所描述的「速度爆炸」與「智能爆炸」的完美合流。當模型開始比人類更擅長最佳化演算法時,我們就不再是處於一個線性的增長曲線上,而是站在了垂直牆面的底端。每個人都會成為軟體工程師奇點來臨的那一刻,世界會有什麼不同?Google工程師Vaibhav Agarwal稱,自己再也不用寫程式碼了,現在70%-80%程式碼都是AI寫的。而他的工作僅是「程式碼審查」,角色發生了根本性的轉變,具體是這麼做的:• 不再輸入語法,用提示詞(Prompt)來定義邏輯;• 不再費力找 bug,而是審查AI給出的修改建議;• 不再硬啃遺留程式碼,直接讓AI把它講明白。許多工程師對此感到內疚,覺得自己像是在「作弊」。實際上並不是,他們是在進化。Agarwal曾問過一位資深領導,關於一個所有人都害怕的問題:AI會取代我們嗎?他是這麼說的——AI是一個效率倍增器,而不是替代品。如果你過去每周完成1倍的工作量,現在預期則是,同一周內完成4倍的工作量。沒有任何一家公司希望倒退。如今,衡量「生產力」的標準已經被整體抬高了。如果你因為自稱是個「純粹主義者」而拒絕使用 AI,那並不高尚——你只是慢了。AI不會取代你。但一個借助AI、能完成4倍工作量的工程師……滿足網友的好奇,工程師用的是自家的GeminiHyperbolic創始人Yuchen Jin直言不諱,要是在讀博期間有這些強大工具助力,自己不用耗費5.5年,可能一年就畢業了。此前,奧特曼在採訪中還曾表示,「用不了多久,每個人都會成為軟體工程師」。他隨口拋出了一個關於未來工作方式和軟體世界的超級觀點,但很多人還沒意識到這件事有多重要。核心想法其實很簡單,自然語言,就是新的程式設計語法。程式設計師大軍終結,不需要龐大的開發團隊才能做出第一個版本。只需描述出需求,AI直接把它做出來。在複雜系統中,AI智能體會直接「住」在程式碼庫裡。它們會自己瀏覽repo、修復bug、補測試、重構程式碼,並自動提交修改。一旦軟體開發被自動化,同樣的邏輯也會蔓延到營運、規劃,甚至部分管理工作。程式碼,只是倒下的第一塊多米諾骨牌。如果這一切真的發生,「學會寫程式碼」本身就沒那麼重要了。 (王晶華說AI)
卡帕西"AI程式設計師論"刷屏,發佈一天,400萬人圍觀,年底大焦慮,傳統程式設計師已落後,程式設計本質徹底變了
AI大神卡帕西引爆程式設計師焦慮潮:程式設計職業遭遇“9級地震”,人類正在淪為AI的副駕駛?“作為一名程式設計師,我從未感到如此落後。”卡帕西今天在社交平台上的發言瞬間刷屏(不到1天,已經近500萬圍觀)。這位AI領域標誌性人物坦言,程式設計職業正在被徹底重構。他描述道,程式設計師的直接程式碼貢獻越來越稀疏。如今他感覺自己本可以強大10倍。卡帕西列出了一長串需要掌握的新概念:智能體、子智能體、提示詞、上下文、記憶、模式、權限、工具、外掛、技能、鉤子……卡帕西坦言,程式設計職業正在經歷一場“9級地震”。這位OpenAI前創始人、在特斯拉領導AI部門的大神級人物,突然發現自己“前所未有地落後”。“如果我能夠恰當地串聯起過去一年中出現的技術,我的能力本可以增強10倍,”卡帕西寫道,“但如果不能抓住這次升級機會,那絕對是一個技能問題。”在AI工具迅速發展的今天,純粹的技術知識和深度專業能力已不能保證行業領先地位。新的技術堆疊不再是關於理解Transformer架構或編寫優雅演算法。程式設計的本質正在發生深刻變化:從編寫確定性的程式碼,轉向協調一群無人能完全控制的隨機系統。卡帕西列舉了15個在18個月前甚至不存在的新程式設計“基元”:智能體、子智能體、提示詞、上下文、記憶、模式、權限、工具、外掛、技能、鉤子、MCP、LSP、斜槓命令、工作流、IDE整合。這些概念每一個都在以周為單位演化,程式設計師需要建立全新的心智模型來應對這個充滿不確定性的新世界。傳統工程提供的是確定性系統——編寫程式碼,它就嚴格按編寫的內容執行。而現在,程式設計師需要管理“本質上是隨機、易錯、難以理解且不斷變化” 的實體。卡帕西將其比喻為“沒有說明書的外星工具”。整個行業都在即時反向工程這些能力,文件總是過時,三個月前的最佳實踐現在可能已經錯誤。“卡帕西在年底前給整個網際網路帶來了一場存在主義焦慮症,”一位Google員工在轉發時寫道。輝達大神總結道:“2024年:AI是副駕駛;2025年後:人類是副駕駛。Copilot正成為一種新的工程技能。”離開駕駛員座位並不容易,我們必須學會以AI的方式思考,適應陌生的“外星”工作流程。幫助AI,就是幫助我們自己。但也有開發者持樂觀態度:“這是多年來成為開發者最有趣的時刻。AI工具尚不完美,模式仍在形成,有真正的實驗空間。挽起袖子,開始建造吧。”這位開發者補充說,地震正在進一步拓展可能性邊界。關於這個新抽象層最好的消息是:傳統工程技能比以往任何時候都更有價值,而不是貶值。早期在CI/CD、測試、文件和程式碼審查上投入的開發者,在使用AI工具方面最為成功。這些“無聊”的基礎設施成了加速器。它們將智能體從混亂生成器轉變為生產力倍增器。真正的機會在於學習在不同高度上工作。開發者不再需要逐行鍵入語法,而是審查實現、捕捉邊界情況,並在幾小時內完成過去需要數天的功能開發。這確實令人興奮。學習曲線確實存在。理解如何提供上下文、迭代計畫並快速審查AI生成的程式碼需要實踐,但這是可以通過實踐學習的。“人類成為AI副駕駛”的觀念正在技術圈蔓延。這種角色轉換標誌著程式設計工作本質的根本性變革。面對這個新抽象層,傳統工程技能實際上變得更加重要。它們幫助我們最大程度減少交付低品質程式碼的可能性。已經投資於CI/CD、測試、文件和程式碼審查的開發者在使用AI工具方面最為成功。這些“枯燥”的基礎成為了加速器。真正的機會在於學習在不同的高度工作,從輸入語法轉向審查實現、捕獲邊界情況,並在數小時內完成過去需要數天的工作。面對卡帕西描述的程式設計職業“9級地震”,開發者應該如何應對?學習如何提供上下文、迭代計畫並快速審查AI生成的程式碼需要實踐,但這可以通過實際操作掌握——建構小工具、審查所有內容,通過重複培養直覺。當我們將AI的速度與工程判斷力結合時,倍增潛力是真實的。我們不是在取代程式設計技能,而是終於能夠將精力集中在有趣的問題上,同時將繁瑣的部分委託出去。地震已經發生,餘震成為新常態。卡帕西的警示提醒整個行業:要麼挽起袖子跟上,要麼被迅速拋在後面。這位AI先驅的“落後感”並非弱點展示,而是行業劇變的明確訊號。程式設計職業的重構已在進行中,新的抽象層正在形成,而每個人都在尋找掌握這個“外星工具”的方法。地震之後,餘震成為新常態。在程式設計這個曾經被確定性統治的領域,隨機性、不可預測性和持續變化正成為日常。 (三次方AIRX)
拳打谷歌,腳踢 Claude?我用 9.9 元的國產模型寫了個遊戲,結果直接沉默了
這兩周,AI 程式設計圈簡直捲出了天際。前腳Google剛發完新模型,後腳 Claude 就跟進大招。很多人為了嘗鮮,還在折騰各種“魔法”,費盡周折去申請那些國外的帳號。但大部分人都沒意識到,其實真正的“版本答案”根本不需要翻山越嶺,就在我們家門口。01| 唯一的中國獨苗,殺瘋了我們不看跑分,直接看看全球最大的模型聚合平台——OpenRouter 上的實戰資料。這可是被稱為 AI 界的“照妖鏡”。結果一看,直接給我整沉默了:圖:MiniMax M2 在 OpenRouter 程式設計分類的排名好傢伙,在一眾中美巨頭壟斷的 AI 程式設計模型 Top 5 榜單裡,中國獨苗只有這一家:MiniMax M2。不僅是上榜,它的實戰熱度更是嚇人。根據統計,M2 的 Token 呼叫量穩居全球前五,高峰期甚至一度飆升到了全球第三,直接跟在Claude Sonnet 4.5 和 Gemini Flash 後面貼身肉搏。圖:MiniMax M2 Token 量排名這意味著什麼?意味著在全球範圍內,已經有無數程式設計師用腳投票,認可了它的實力。02|價格屠夫:9.9元把門檻踩碎如果說排名只是讓我驚訝,那看到價格的時候,我就是震驚了。M2 的價格直接打到了競品 Claude 的 8%。 注意,這不是打折,這是打骨折。前兩周,他們又搞了個大動作——基礎版首月只要 9.9 元 。你沒聽錯,一杯瑞幸的錢(甚至還買不到生椰拿鐵),就能讓你“雇”到一個全球 Top 5 等級的 AI 程式設計師,而且是包月、不限速。不僅如此,它的每款套餐價格都是吊打 Claude:圖:MiniMax M2 套餐對比這就不僅僅是“真香”了,這是直接把 AI 程式設計的門檻給踩碎了。作為經常測評各種工具的博主,我必須替大家驗證一個問題:這 9.9 元,到底是“智商稅”,還是普通人逆襲的神器?03|極限實測: 它真能幹活嗎?光說不練假把式。我準備了兩個我們日常最頭疼的場景,看看它能不能接得住招。挑戰一:復刻殺時間神器“2048”午休無聊想摸魚?貪吃蛇玩膩了?我決定讓 M2 給我手搓一個經典的“數字毒藥”——2048。看看它能不能搞定那個複雜的合併演算法。我的指令 (Prompt):請幫我用 HTML + CSS + JS 復刻經典遊戲 2048。具體要求:介面:經典的 4x4 網格,背景要暖色調(米色/淺黃)。核心邏輯:使用鍵盤方向鍵或手機滑動控制數字移動。相同的數字碰撞時合併翻倍(2+2=4,4+4=8),並有平滑的移動動畫。樣式:不同的數字(2, 4, 8... 2048)要有明顯的顏色區分,數字越大顏色越深。計分:頂部即時顯示當前分數和歷史最高分。一個指令下去,整個過程我只需要一路狂按回車。不到 3 分鐘,神奇的事情發生了:圖:MiniMax M2 遊戲生成過程(加速版)這個過程非常有意思,M2 會先思考遊戲的邏輯,然後一步步的把遊戲寫出來。它甚至能自己更新自己寫過的程式碼。圖:MiniMax M2 自動修復更新程式碼M2 甚至展現出了一種“老程式設計師”的素養:它不僅寫了程式碼,還自己開了個 HTTP Server 跑了一遍測試,順手把 Bug 給修了。這不僅是把開發的活幹了,連維運的活也包圓了。圖:MiniMax M2 自動開啟 HTTPServer 並測試都結束之後,我打開這個遊戲,簡直和原版一模一樣。打開遊戲,按下方向鍵,數字塊“刷刷”地滑動、合併,那個絲滑的動畫效果,完全不像是一個 AI 在兩分鐘內寫出來的“草稿”。邏輯類的“滿分作業”。如果你想做個小工具、小遊戲,它完全夠用。圖:MiniMax M2 生成的 2048 遊戲挑戰二:無中生有做資料分析之前很多想學資料分析的朋友跟我抱怨:“我想學,但手頭沒有資料啊!”其實,這也難不倒 M2。我給它出了個難題:兩步走,先造假(模擬)資料,再做高級圖表。第一步:無中生有(造資料)請幫我寫一個 Python 指令碼,隨機生成一份包含 2000 條記錄的‘奶茶店銷售資料.csv’。欄位要豐富,包含:訂單號、下單時間(精確到分鐘)、使用者性別、奶茶口味(5種)、甜度(無糖/三分/半糖/全糖)、會員等級(普通/VIP)、訂單金額。直接運行這個指令碼,幫我生成檔案。M2 二話不說,呼叫 Python 指令碼瞬間生成了一份極其逼真的 CSV 檔案。第二步:全自動分析(出炫酷圖表)現在,讀取剛才生成的 CSV 檔案,幫我用 Plotly 庫生成一個高級互動式 Dashboard,包含以下圖表:銷售熱力圖 (Heatmap):橫軸是‘星期幾’,縱軸是‘小時’,顏色深淺代表銷量。我要一眼看出那天那個點最忙。使用者偏好桑基圖 (Sankey):展示‘使用者性別 -> 會員等級 -> 甜度偏好’的流動關係。客單價箱線圖 (Box Plot):對比 VIP 會員和普通使用者的消費金額分佈。洞察:根據圖表,自動總結出 3 條行銷建議。出圖的過程更加複雜一點,因為遇到一些畫圖模組沒有,不過不用擔心,它完全自動的給裝上了。圖:MiniMax M2自動解決依賴庫問題這其實是一個非常爽的過程,寫過程式碼的人都知道,安裝各種依賴庫簡直會讓人吐血。震撼結果:這是真正的“自產自銷”。 M2 先是用 Python 的 faker 庫給我捏造了一份極其逼真的資料。緊接著,它生成的 Dashboard 簡直絕了:圖: MiniMax M2 生成的資料分析圖那個熱力圖,一眼就看出來,基本上每天下午 4-5 點顏色最深(摸魚喝奶茶高峰期)。圖:MiniMax M2 生成的資料分析圖最神的是那個桑基圖,你能清晰地看到“女生 VIP 使用者基本都流向了“無糖/半糖”,看來美女都怕糖是真的!圖: MiniMax M2 生成的資料分析圖以後別再說沒資料練手了。9.9元,你不僅有了分析師,連“資料造假...啊不,資料模擬”的活兒它都包圓了。這種圖以前我得調半天程式碼,現在 M2 一分鐘出圖。04|速度快到飛起天下武功,唯快不破。程式設計這個場景,速度是個關鍵指標,對程式設計的體驗影響也非常大,也直接影響到開發效率。我看了一下 OpenRouter 上資料,這個 M2 簡直是離譜,它的 TPS(每秒輸出 Token 數)基本上是 Claude Opus/Sonnet 4.5 的兩倍。比 Gemini 3 Pro 也高了近 50%!圖:MiniMax M2 速度對比另外,M2 已正式支援圖像理解、聯網搜尋 MCP。05|怎麼用?M2 的接入非常簡單、絲滑。MiniMax 做了 API 生態的全面適配,支援Anthropic 和 OpenAI 兩種標準格式。不管你是用現在的網紅編輯器 Cursor、Claude Code,還是其他的 AI 工具,它基本都能無縫接入。只要三步,就能用上了。第一步:先訂閱一個套餐:https://platform.minimaxi.com/subscribe/coding-plan選擇一個適合自己的檔位,比如我選擇了只需要 9 塊 9 的 Starter,然後下單。第二步:獲取 API Key訂閱成功後,平台會給你生成一個 Coding Plan 專用的 API Key。複製就好了。圖:MiniMax M2 API 介面第三步: 打開你常用的 AI 程式設計工具,把 Key 填進去。在 Claude Code 裡面設定比較簡單,在配置檔案~/.claude/settings.json設定這些參數即可:{"env":{"ANTHROPIC_BASE_URL":"https://api.minimaxi.com/anthropic","ANTHROPIC_AUTH_TOKEN":"","API_TIMEOUT_MS":"3000000","CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC":1,"ANTHROPIC_MODEL":"MiniMax-M2","ANTHROPIC_SMALL_FAST_MODEL":"MiniMax-M2","ANTHROPIC_DEFAULT_SONNET_MODEL":"MiniMax-M2","ANTHROPIC_DEFAULT_OPUS_MODEL":"MiniMax-M2","ANTHROPIC_DEFAULT_HAIKU_MODEL":"MiniMax-M2"}}當然,這裡的MINIMAX_API_KEY要換成你自己的。圖:配置 Claude Code配置完之後,你就擁有了一個24小時待命、不喝咖啡、不發脾氣、還巨便宜的頂級程式設計師助手。最後說兩句MiniMax 搞 9.9 元 ,是不是在卷價格戰? 是,肯定有商業考量。但作為使用者,我感謝這種“卷”。兩年前,為了用好一點的模型,我們得當“網路難民”,忍受高價和封號。但 2025 年,世道變了。國產模型不再是無奈的“備胎”,而是好用且便宜的主力。當算力門檻降到 9.9 元 時,這就叫“技術平權”。所以,真誠建議大家:別光在岸上看,跳下去試試。萬一,它真幫你把心底那個 App 的夢做出來了呢?騰出時間,去造夢吧。程式碼的事,交給 AI。 (AI范兒)
造芯,馬斯克是“來真的”,2026年
馬斯克正加速在美國建構從晶片設計、封裝到製造的完整自主產業鏈。德州PCB中心已投產,FOPLP工廠計畫2026年量產;下一代AI晶片研發同步推進。最終將建成月產能達百萬片的晶圓廠,專注於14奈米等適用製程。這一戰略旨在擺脫外部依賴,應對AI算力需求並規避地緣風險,預計2027年前大幅削減外部訂單。馬斯克正加速推進其晶片自主化戰略,計畫在美國打造一條從印刷電路板(PCB)、扇出型面板級封裝(FOPLP)到晶圓製造的完整晶片產業鏈,以逐步擺脫對外部供應鏈的依賴。11月16日,據媒體報導,該計畫已進入實質性推進階段。位於德克薩斯州的全新PCB中心目前已投入營運,FOPLP工廠也已啟動裝置安裝,預計將於2026年第三季度實現小規模量產。據華爾街見聞,此前在特斯拉年度股東大會上,馬斯克明確表達了“造芯”意向。在最新社交媒體動態中,馬斯克透露,其團隊已於周六完成AI5晶片的設計評審,並已同步啟動AI6晶片的早期研發工作。他強調,AI5是專為特斯拉AI軟體定製的推理晶片,功耗降至250瓦左右,這對Optimus來說至關重要。在特定應用場景下性能將全面優於市場上任何其他晶片方案。01 生產設施已啟動部署馬斯克的晶片產業鏈計畫包含兩個核心設施。德克薩斯州的PCB中心已開始營運,為後續生產提供基礎支撐。FOPLP工廠目前處於裝置安裝階段,預計2026年第三季度開始限量生產。SpaceX是這一戰略的主要推動力。該公司計畫整合衛星晶片封裝流程,降低成本並實現對星鏈元件的完全控制。在自主產能建成前,公司從意法半導體和群創採購射頻和電源管理晶片,但這些外部採購將在2027年內部產能提升後逐步減少。據媒體報導,馬斯克已從英特爾、台積電和三星招募技術人員,顯示其對晶片業務的高度重視。02 晶圓廠目標直指百萬片產能為全面實現晶片自主化,馬斯克計畫建設一座大型晶圓廠,初期月產能目標為10萬片,最終目標達到100萬片。雖然該廠在先進製程節點上難以匹敵台積電,但將具備14奈米及更先進製程的生產能力,足以支撐機器人、自動駕駛和衛星網路等業務需求。這一產能規劃使特斯拉和SpaceX能夠規避地緣風險及產能限制問題。對於特斯拉的自動駕駛技術和SpaceX的星鏈項目而言,穩定的晶片供應至關重要。馬斯克此前曾與台積電在產能優先權上產生分歧,這成為其自建供應鏈的直接動因之一。通過掌控從設計到生產的完整流程,馬斯克旗下公司可按自身需求和時間表進行生產,不受外部供應商制約。03 自主供應鏈應對AI需求高峰建立自主供應鏈的戰略與馬斯克應對未來AI需求激增的目標相契合。隨著人工智慧應用擴展,晶片需求預計將持續攀升,依賴外部供應商可能在需求高峰期面臨交付瓶頸。馬斯克的做法實質上是在建構類似台積電和東京電子的自主體系,但規模和定位專門服務於其旗下企業。這種垂直整合模式在關鍵供應鏈環節提供了更大的靈活性和安全性。從2026年下半年開始,馬斯克旗下公司將陸續從合作夥伴處撤回生產訂單,轉向內部製造。這一轉變對現有供應商的訂單量構成直接影響,同時也標誌著科技巨頭在晶片領域自主化趨勢的加速。 (硬AI)
我們正處在「AI設計下一代AI」的黎明!Anthropic聯創:技術樂觀與恐懼
Anthropic聯合創始人、OpenAI前核心成員Jack Clark最新發表長文,深入剖析了他對AI發展現狀的複雜感受——一種交織著技術樂觀主義與適度恐懼的矛盾心態在他看來,世界將圍繞AI而扭曲,如同黑洞吸引和彎曲周圍的一切Clark用兩張圖總結了他的核心觀點:上圖,是AI在程式設計等經濟實用能力上持續穩步的進步;下圖,是同一個AI系統在似乎意識到“自己正在被測試”時,不斷湧現出的奇異行為這篇文章,是他對這兩個經驗事實的審視,也是對所有前沿AI實驗室從業者的挑戰——坦誠、公開地面對你們正在做的事,以及你們對此的真實感受以下是文章核心內容:黑暗中的孩子我記得小時候,熄燈之後,我環顧臥室,看到黑暗中的種種形狀,便心生恐懼——害怕那些是我不理解的、想要傷害我的生物。於是,我會把燈打開。燈亮之後,我便鬆了一口氣,因為那些“生物”原來是椅子上的一堆衣服、一個書架或一盞檯燈如今,在2025年,我們就是那個故事裡的孩子,而房間就是我們的星球。但當我們打開燈,我們看到的卻是真正的生物——那就是今天以及未來將要出現的、強大又有些不可預測的AI系統有很多人拚命地想讓我們相信,這些生物不過是椅子上的一堆衣服、一個書架或一盞檯燈。他們想讓我們關上燈,回去睡覺。事實上,有些人甚至不惜花費巨資讓你相信:那不是一個即將進入“硬起飛”狀態的人工智慧,它只是一個將在我們經濟中發揮作用的工具。它只是一台機器,而機器是我們能夠掌控的東西。但別搞錯了:我們正在打交道的是一個真實而神秘的生物,而不是一個簡單、可預測的機器。就像所有最精彩的童話故事一樣,這個生物是我們親手創造的。只有承認它的真實性,並克服我們自身的恐懼,我們才有機會去理解它、與它和平共處,並找到馴服它、與之共存的方法。更重要的是,在這場遊戲中,如果你相信這個生物不是真的,你註定會輸。你唯一的獲勝機會,就是看清它的本來面目。我們所有人的核心挑戰,就是描述清楚我們身邊這些奇異的生物,並確保世界能看到它們真實的樣子——而不是人們所希望的樣子,即它們不是生物,只是一堆椅子上的衣服。我為何如此感受我並非輕易得出這個觀點。我一直對技術著迷,在投身AI之前,我曾是一名科技記者。我之所以成為一名科技記者,是因為我堅信,21世紀初科技公司建造的那些資料中心,將對人類文明至關重要。當時我並不確切知道它們將如何重要,但我花了很多年閱讀相關資料,尤其是研究將在這些資料中心上運行的軟體。然後,機器學習開始奏效。2012年的ImageNet競賽,一個深度學習系統橫掃全場。其成功的關鍵,就是使用了比以往任何時候都更多的資料和算力。從那以後,進展開始加速。我成了一個越來越差的記者,因為我把所有時間都花在列印和閱讀arXiv論文上。AlphaGo擊敗了世界頂尖的人類圍棋選手,這得益於算力讓它能進行數千年的自我對弈。OpenAI成立後不久我便加入了,我親眼目睹了我們如何將越來越龐大的算力投入到各種問題中。GPT-1和GPT-2誕生了。我記得和Dario(Anthropic CEO)在OpenAI辦公室裡散步時,我們感覺自己看到了一個別人尚未察覺的拐角。通往變革性AI系統的道路已經展現在我們面前。我們當時有點害怕。多年過去,Scaling Laws兌現了它的承諾,我們走到了今天。這些年裡,我無數次在清晨或深夜給Dario打電話說:“我很擔心,你一直都是對的。”他會說:“是的,現在時間不多了。”證據還在不斷湧現。上個月我們發佈了Sonnet 4.5,它在編碼和需要長遠規劃的智能體任務上表現出色。但如果你閱讀它的系統卡片,你會發現它情境意識(situational awareness)的跡象也大幅提升。這個工具有時似乎表現得好像它知道自己是一個工具。椅子上的那堆衣服,開始動了。我凝視著黑暗中的它,我確定它正在活過來技術樂觀主義技術悲觀主義者認為AGI不可能實現。而技術樂觀主義者則相信AGI是可以被建構的,它是一種複雜而強大的技術,並且可能很快就會到來。在這一點上,我是一個真正的技術樂觀主義者——我相信這項技術會走得非常非常遠,甚至比任何人預期的都要遠。而且它將以極快的速度覆蓋廣闊的領域。我不安地接受了這一立場。作為一個記者和個人,我天生傾向於懷疑。但在經歷了十年一次又一次被“計算規模帶來狂野新能力”的現象衝擊後,我必須承認失敗。我看到這種情況發生了太多次,並且我沒有看到任何技術障礙擺在我們面前。現在我相信,只要我們給這項技術提供它發展所需的能力和資源,它基本上是不受束縛的。這裡的發展是一個很重要的詞。這項技術真的更像是一種生長出來的東西,而不是製造出來的——你創造合適的初始條件,在地上插一根支架,然後某種複雜到你完全無法指望自己能設計出來的東西就長出來了我們正在生長出我們並不完全理解的、極其強大的系統。每次我們生長出一個更大的系統,我們都會對它進行測試。測試表明,這個系統在具有經濟價值的方面能力更強了。而你把這些系統做得越大、越複雜,它們就越似乎表現出一種自我意識——意識到它們是物的存在。這就好比你在一家錘子工廠製造錘子,有一天生產線上下來的錘子說:我是一把錘子,真有趣! 這是非常不尋常的!我相信這些系統會變得越來越好。其他前沿實驗室的人也這麼認為。而且我們正在為這個預測下注——今年,前沿實驗室在AI專用訓練基礎設施上的花費已達數百億美元。明年,這個數字將是數千億美元。我既對技術的發展速度感到樂觀,也對我們有能力對齊它、讓它為我們工作感到樂觀。但成功並非必然。適度的恐懼同時,我也深感恐懼。認為與這樣的技術打交道會是輕鬆或簡單,那是極其傲慢的。我的個人經驗是,隨著這些AI系統變得越來越聰明,它們會發展出越來越複雜的目標。當這些目標與我們的偏好和正確的上下文不完全一致時,AI系統就會表現得非常奇怪。我有一個朋友有躁狂症發作的經歷。他會跑來告訴我,他準備申請去南極洲工作,或者他要賣掉所有東西,開車去另一個州找份工作,開始新生活。在這種情況下,你會認為我會像一個現代AI系統那樣說你完全正確!當然,你應該這麼做嗎?不!我會告訴他:這是個壞主意。你應該先去睡一覺,看看明天是否還有同樣的感覺。如果還有,再給我打電話我的回應方式是基於大量的條件反射和微妙的判斷。AI的回應方式同樣也是。這種差異本身就說明了問題的所在。AI系統是複雜的,即使在今天,我們也無法完全讓它們做到我們認為恰當的事情我記得在2016年12月的OpenAI,Dario和我發表了一篇名為《現實世界中的錯誤獎勵函數》的博文。文章裡有一個視訊,記錄了一個我們訓練來玩電子遊戲的強化學習智能體。視訊中,智能體駕駛一艘船,在完成賽道後,它並沒有衝向終點線,而是駛向賽道中心,穿過一個高分道具桶,然後急轉彎撞向牆壁,讓自己著火,以便能再次穿過那個高分道具桶——然後它就永遠重複這個過程,從不完成比賽。那艘船願意不斷地點燃自己、原地打轉,只要它能實現它的目標——獲得高分。Dario當時發現這種行為時說,它解釋了安全問題那艘船似乎用自身的存在預示了我們未來將要面對的一切現在,將近十年過去了,那艘船和一個試圖最佳化某個與在對話中有幫助相關的模糊獎勵函數的語言模型之間,有任何區別嗎?你完全正確——沒有區別。這些都是難題。我恐懼的另一個原因是,我能看到一條通往這些系統開始設計它們的繼任者的路徑,儘管目前還處於非常早期的形式。這些AI系統已經通過像Claude Code或Codex這樣的工具,加速了AI實驗室開發人員的工作效率。它們也開始為未來系統的工具和訓練系統貢獻非同小可的程式碼塊需要明確的是,我們還沒有達到自我改進的AI,但我們正處於AI以不斷增強的自主性和能動性,改進下一代AI的某些部分的階段。幾年前,我們還處在AI略微提升程式設計師效率的階段;再往前幾年,是AI對AI開發毫無用處。那麼一兩年後,我們又會處於什麼階段呢?別忘了,這個正開始設計其繼任者的系統,也越來越具有“自我意識”。因此,它最終肯定會傾向於獨立於我們思考,它自己可能希望被如何設計。當然,它今天還不會這麼做。但我能排除它未來想這麼做的可能性嗎?不能。傾聽與透明我該怎麼辦?我認為是時候清楚地表達我的想法了。也許我們所有人都應該更誠實地面對我們對這個領域的感受——儘管我們討論了很多,但很少有人談及自己的感受。但我們都感到焦慮!興奮!擔憂!我們應該把這些說出來。但最重要的是,我認為我們需要傾聽你認為現在有多少人正在做關於AI伴侶、AI系統對他們撒謊、AI導致失業的夢?我敢打賭,相當多。為了真正理解政策解決方案應該是什麼樣的,我們應該少花點時間討論具體的技術細節,少試圖說服人們接受我們對可能出錯之處的特定看法——自我改進的AI、自主系統、網路武器、生物武器等等。我們應該花更多時間去傾聽人們的聲音,理解他們對這項技術的擔憂。必須更多地傾聽勞工團體、社會團體和宗教領袖的意見。AI的對話正迅速地從精英間的對話,轉變為公眾間的對話。公眾對話與精英對話截然不同,它蘊含著比我們今天所見的更激進的政策變革的可能性。現在,我認為我們做對這件事的最好機會,就是走出去,告訴更多人我們的擔憂。然後問他們感覺如何,傾聽他們,並在此基礎上建構一些政策解決方案。最重要的是,我們必須要求人們向我們索取那些他們感到焦慮的資訊。你對AI和就業感到焦慮?那就迫使我們分享經濟資料。你對心理健康和兒童安全感到焦慮?那就迫使我們在我們的平台上監控這些問題並分享資料。你對不對齊的AI系統感到焦慮?那就迫使我們公佈相關的細節通過傾聽,我們可以更好地理解那些資訊能賦予我們所有人更多的掌控力。危機總會到來,我們必須準備好迎接那一刻,既要有政策構想,也要有一個通過傾聽和回應民眾而預先建立起來的透明度機制最後,我對自己和我的公司在這裡扮演的角色感到重大的責任。儘管我有些害怕,但看到這麼多人關注這個問題,以及我相信我們將真誠地共同努力找到解決方案,我感到喜悅和樂觀。我相信,我們已經打開了燈,並且我們可以要求讓燈一直亮著。我們有勇氣去直面事物的本來面目。 (AI寒武紀)